运用正则表达式可以找到文档中符合条件的内容
1 | title = re.search('<title>(.*?)</title>',html,re.S) |
search找到一个符合条件的就会停止,而findall会扫描整个文档找到尽可能多的符合条件的内容
jsonContent:
meta: false
pages: false
posts:
title: true
date: true
path: true
text: false
raw: false
content: false
slug: false
updated: false
comments: false
link: false
permalink: false
excerpt: false
categories: true
tags: true